摘要。控制工程中的重复和重要任务是在约束下进行调整,从概念上讲,仅通过噪声评估才能访问黑框函数。例如,在预设司法机构的控制练习参数中,通常会用工厂的反馈在线调整,并且只能尝试使用安全的Pa-Rameter值,例如不稳定。最近,已经针对这种重要的概率部署了机器学习方法,尤其是贝叶斯优化(BO)。为处理安全性,安全BO的算法,尤其是SafeOpt-type算法,这些算法在基于学习的控制,机器人技术和相邻领域方面享有很大知名度。但是,我们确定了实践安全的两个重要障碍。首先,SafeOPT型算法依赖于标志性的不确定性界限,大多数实现将这些算法替换为理论上不支持的启发式方法。第二,理论上有效的非确定性界限至关重要地取决于数量 - 目标函数的繁殖内核希尔伯特空间规范 - 目前无法使用已建立的先验工程知识可靠地绑定它。通过仔细的数值实验,我们表明这些问题确实会导致安全违规。为了克服这些问题,我们提出了Lipschitz仅安全的贝叶斯优化(LOSBO),这是一种仅依赖于已知Lipschitz为其安全而绑定的安全的BO算法。此外,我们提出了一个避免搜索空间网格的变体(LOS-GP-UCB),因此即使适用于适度的高维问题。
主要关键词